Искусственный интеллект (ИИ) становится ключевой технологией XXI в., с которой неразрывно связано повышение производительности труда во всех сферах деятельности. Прошлый год в России и мире стал годом ИИ, а главным оказалось слово «нейросеть». На наших глазах появились и развиваются технологии, возможности которых ещё несколько лет назад казались недостижимыми. Умные рекомендательные сервисы, создание и редактирование материалов, генерация изображений по тексту и видео, анимация, робоозвучка, автоматический перевод, аналитика данных и прочие сервисы, основанные на больших языковых моделях, стали привычными для многих людей инструментами.
Возможности и перспективы использования нейросетей в профильной индустрии обсудили участники отраслевой конференции «Книжный бизнес: проекты цифровой трансформации»¹.
¹ Организатор — информационно-аналитический журнал «Университетская КНИГА» при поддержке Министерства цифрового развития, связи и массовых коммуникаций РФ и Российского книжного союза.
ТАКТИКА И СТРАТЕГИЯ ТЕХНОЛОГИЧЕСКИХ ПАРТНЁРОВ
Какие технологии развиваются наиболее активно для контентных индустрий? Какова архитектура моделей и их функционал? Как происходит обучение и какими методами достигается улучшение сервисов? Каковы национальные особенности и ключевые направления развития?
Как отметил Денис ДИМИТРОВ, руководитель команды разработки нейросетей Kandinsky, управляющий директор по исследованию данных, руководитель научной группы Sber AI Research, мы живём в эпоху очередной революции ИИ, породившей генеративный трек. Появились фундаментальные модели, которые создают контент и учатся в формате генерации: следующего слова или токена, очередной части картинки или фрагмента видео. Обучаются они на огромном количестве данных, которые берут в основном из открытых источников, — на триллионах фрагментов текстов по всем возможным тематикам, миллиардах картинок и на других типах данных или модальностях. Такая эволюция, по мнению ряда экспертов, позволила предположить, что мы приближаемся к общему ИИ, но это тема отдельных дискуссий.
По словам эксперта, сейчас развиваются модели, работающие с любыми модальностями. Текстовые модели способны продемонстрировать «знания» ИИ, потому что текст — основной источник коммуникации и информации.
— Как поговорить с моделью? Надо научить её понимать текст на огромном объёме данных. Дата-инженеры собирают контент из Интернета, и на каждом очередном фрагменте модель учится предсказывать следующий токен (слово). Потом она доучивается в формате ответов на вопросы, которые мы задаём в разных областях знания. Модель действительно способна поддерживать осмыс72 ленный диалог, её теоретически можно попросить решить любую задачу, в том числе сложную логическую. Было немало прикладных проектов, которые мы осуществляли, чтобы показать, на что способны модели. Это проект с Павлом Пепперштейном, когда мы создали книгу совместно с ИИ. Половину написала модель RuGPT3 (предшественник GigaChat), а половину — П. Пепперштейн. Модель, конечно, доучивалась на стилях автора, и потом всё было перемешано в случайном порядке. Два-три года назад не все могли определить, где чей текст. Такие модели способны генерировать стихи, но это более сложная задача: кроме генерации следующего слова надо предлагать рифмы, — пояснил эксперт.
Над чем работают специалисты в области генеративного ИИ сейчас? Это не только языковые модели, но и мультимодальные — способ упростить коммуникацию и подражать человеку.
— Люди существуют в разных модальностях, работают с разными типами данных: визуальными, звуковыми, тактильными, вкусовыми. Как обучить модель, которая понимает мир комплексно? Всё начинается с текста как основы коммуникации, затем исследователи пытаются научить модель понимать изображения, видео, звуки. Есть архитектура, которая называется OmniFusion: она работает и с текстом, и с изображениями. Например, может купить билет в театр по его изображению, распознать то, что есть в холодильнике, и предложить рецепт блюда, умеет решать логические задачи, помогать врачам, искусствоведам. При этом надо скептически относиться к любой модели такого рода, потому что она может ошибаться (галлюцинировать). В целом к человеку это тоже относится, но у нас это называется фантазией, — заметил спикер.
Ещё одна мультимедийная модель, которая генерирует изображения, — Kandinsky. Это целая линейка продуктов: семь — для генерации картинок и две — для видео. Примеров применения огромное количество: иллюстрации, реклама. Молодёжи нравится интерактив, это помогает заинтересовать её книгой, музеем и т.п. Модель способна не только генерировать картинку, но и продолжать её, создавать видео на произвольные темы.
Интересный и полезный проект «Digital Пётр» — распознавание автографов Петра Великого и в принципе кириллических рукописей. Почерк императора был очень непонятным, и мы создали модель, которая его распознаёт. Это большое подспорье для историков: удалось распознать рукописи, которые до 2020 г. не были расшифрованы. Модель работает с высокой эффективностью: почти 98% правильно распознанных символов.
Очевидно, что ИИ-технологии могут быть адаптированы под полезные кейсы, в том числе касающиеся литературы и истории, подчеркнул в завершение эксперт.
Тему продолжил Виталий ГРИГОРАШ, руководитель сервиса «Букмейт» компании «Яндекс»:
— Число подписчиков «Яндекс Плюса» насчитывает около 33 млн, и мы стараемся, чтобы как можно больше людей в России пользовались сервисами, читали и слушали книги. В основе «Яндекса» лежат технологии, которые обеспечивают сервисам и их пользователям новые преимущества и возможности. «Букмейт» не отстаёт, и, как только сервис стал частью «Яндекса», мы начали применять технологии, чтобы чтение и слушание книг становились проще, удобнее и интереснее. Одна из самых сложных задач, которую мы успешно решили в этом году, — запуск функции виртуального рассказчика. Очевидно, что потребление аудиокниг растёт. Но контента, профессионально озвученного дикторами, не так много: около 90% произведений не имеет аудиоверсий. Мы изучаем сценарии потребления пользователями контента и видим, что в условиях современного городского ритма люди часто меняют форматы. Вечером они могут начать читать, а пока едут на работу, слушают. Важно, что это один и тот же контент и есть потребность в переключении между форматами. Технологии могут эту задачу решить. Мы запустили функцию виртуального рассказчика на основе технологии «Яндекса» SpeechKit. Обучали эту модель на длинных художественных текстах, работали с дикторами, которые профессионально озвучивали сэмплы, и попытались получить аудиоверсию.
Эксперт подробно рассказал о ключевых этапах создания аудиоверсии:
— Первый — нормализация текста, подготовка его для голосового воспроизведения. Например, если написано «г. Москва», мы знаем, что это город, и раскрываем слово. То же самое делаем с аббревиатурами, сокращениями, датами, инициалами.
Второй — фонетическая запись, т.е. расстановка ударений в тех словах, которые в зависимости от ударения меняют смысл, например «плачу» и «плачу». Модель изучает контекст вокруг слова и определяет, как поставить ударение.
Следующий этап: чтобы голос не звучал монотонно и неестественно, важно определить паузы в предложениях: где рассказчик должен остановиться, как того требует синтаксис, и всё это размечается. Важно понимать, где предложение вопросительное, где восклицательное. В зависимости от этого станет меняться интонация, виртуальный рассказчик будет знать, куда сместить акцент. Мы специально работали с дикторами, для того чтобы обучать модель интонированию. Когда профессионал читает длинный текст, это не то же самое, что перекидываться короткими фразами.
На последнем этапе производится синтез текста.
Как отметил спикер, на текущий момент доступно более 100 тыс. одобренных правообладателями книг, которые можно слушать при помощи виртуального рассказчика.
Ещё одна не менее важная и востребованная функция — распознавание аудио и превращение его в текст. В «Букмейте» синхронизируют прогресс чтения между аудиоверсией и текстовой. Для этого аудио надо превратить в текст, проанализировать его и сравнить текст оригинальной книги с полученным вариантом. По словам выступающего, это тоже нетривиальная задача, потому что часто аудиоверсия не совпадает с текстовой. Есть разное количество сносок, которые никогда не озвучиваются или озвучиваются частично, поэтому приходится сверять буквально каждый абзац. Функционал также работает в синхронизации с «Яндекс Музыкой» и «Алисой».
Команда «Букмейта» также развивает сервис персональной рекомендации книг.
— В этом году мы пытаемся сделать так, чтобы вся книжная витрина подстраивалась под интересы пользователя. Если вы предпочитаете какой-либо жанр, то он будет представлен иначе, чем у других пользователей. Учитывая интересы, мы показываем читателю более релевантные книги, — заявил эксперт.
Александр ФЕФЕЛОВ, продакт-менеджер AI (сервис «Строки», МТС), поделился некоторыми международными трендами в отношении того, что происходит на рынке ИИ. По данным компании McKinsey, приведённым экспертом, почти каждый второй руководитель считает, что ИИ необходимо внедрять в рабочие процессы, и некоторые это уже сделали. Многие компании рассматривают внедрение ИИ в продукты, сервисы и управление рисками, а также увеличение инвестиций в ИИ в ближайшие годы. В то же время в литературном творчестве нейросети пока недостаточно эффективны. Исследователи во Франции проанализировали, как пишет ChatGPT в сравнении с реальным писателем. И человек, и чат написали рассказы по 30 темам. Оказалось, что по итогам экспертизы 5 тыс. литературных критиков ИИ недостаточно хорошо справляется.
— Очевидно, что самый эффективный путь — это синергия человека с ИИ. Поэтому наша миссия — улучшать читательский опыт с помощью нейросетей. После запуска сервиса мы создали качественную рекомендательную систему, позволяющую читателям получать контент, который им нравится. Экспериментировали с разными форматами перехода текста в аудио, озвучивали книги с помощью технологии speech-to-text. В этом году сделали ещё один шаг: внутри продукта внедрили такой способ создавать контент, как генерация изображений, обложек для книг, а затем и их анимирование. По нашему мнению, ИИ позволит улучшить пользовательский опыт, делать рекомендации по жанрам и т.п. Ещё одно перспективное направление — метаданные: теги, жанры, аннотации с минимизацией рутинной работы людей. Можно двигаться в сторону совершенствования визуализации книг, создания уникальных обложек, буктрейлеров и иллюстраций. Следующий шаг — видеопродакшен, — рассказал эксперт.
Есть ли какие-либо преимущества у российских разработок перед зарубежными? Эксперты поделились своим видением.
А. Фефелов:
— «Строки» — единственный в мире сервис, который начал создавать «живые» обложки. Это большая заслуга и серьёзное движение навстречу читателю, но уверен, что прорывные шаги по улучшению пользовательского опыта ещё впереди.
В. Григораш:
— Мы следим за развитием технологий, в том числе синтеза голоса. «Яндекс» сейчас работает в направлении других языков. В частности, мы запустили «Алису» на арабском языке. Но важно не то, как мы технологически гонимся за мировыми конкурентами, а то, как наша аудитория в СНГ и России это воспринимает. Если мы предоставим достаточную ценность и качество продукта, это будет востребовано.
Д. Димитров:
— Конечно, мы стремимся делать то, чего ещё нет в мире. Например, известно, что есть модели генерации видео, в частности всем известная Suna. Но это закрытые разработки: что внутри, «под капотом», неизвестно. Нам приходится делать собственные архитектуры, собирать свои датасеты, учиться, экспериментировать, адаптировать разработки под русский язык. Конечно, креативность моделей пока не дотягивает до уровня человеческого творчества. Убеждён в том, что ИИ лишь помощник человека, инструмент, который много что умеет, но это не замена креативности человека, а её улучшение с точки зрения эффективности.
ОТРАСЛЕВЫЕ КОЛЛАБОРАЦИИ И ПРОЕКТЫ
Как выстраивается взаимодействие книжной отрасли с технологическими партнёрами? Насколько авторы, издатели, читатели готовы к подобным инновациям? Что наиболее востребованно и какие книжные эксперименты оказались наиболее удачными?
Александр ЛИМАНСКИЙ, сооснователь и акционер ИГ «Альпина», генеральный директор цифрового бизнес-юнита группы «Альпина Диджитал», сообщил, что в компании решили сосредоточить все цифровые активы в одном бизнес-юните. На данный момент это ряд направлений. Первое, довольно очевидное, — производство и продажа цифрового контента.
Есть несколько направлений, на которые компания делает ставку, это, в частности корпоративная библиотека:
— Мы решили все книги, выпускаемые издательством, упаковать в единую оболочку, которая была бы интересна крупным и средним компаниям, и они могли бы с её помощью обучать сотрудников. Это подписная модель, мы предоставляем доступ на год, и цена зависит от количества пользователей. На данный момент у нас более 300 клиентов.
Следующее направление — интернет-магазин:
— Размышляем о том, как трансформировать данный актив. Безусловно, мы не можем конкурировать с такими площадками, как Ozon и Wildberries, но планируем выходить за пределы печатных книг: добавлять курсы, образовательные продукты, для того чтобы повысить ценность и выручку этого направления.
Развивается направление edTech:
— Рынок онлайн-образования гораздо больше книжного, он очень конкурентный, но мы видим несколько своих преимуществ: огромная база контента и доступ к авторам, которые его генерируют. Мы вторгаемся в эту новую нишу и хотим занять своё место. «Альпина Плюс» — платформа самообразования для физических лиц. Направление выросло из корпоративной библиотеки, но подписная модель иная. В принципе для подписки необходимо огромное количество контента. В «Альпине Плюс» только книги издательской группы, но есть возможность добавлять аудиовизуальный образовательный контент. Думаю, что в итоге получится гибридная модель, где будут электронные и аудиокниги, вебинары и курсы, которые можно покупать по подписке и поштучно.
Развивается AlpinaGen — агрегатор нейросетей, упакованный в удобный формат:
— Мы нацеливаемся на корпоративный сегмент, прежде всего на клиентов, работающих с корпоративной библиотекой, и предоставляем доступ к самым популярным нейросетям: ChatGPT, Claude, Gemini, Midjourney. Те, кто пользуется этими инструментами, знают, что необходимы VPN, зарубежная карта. Мы предоставляем сервис без этих ограничений, по сути продаём подписку. Таким образом, сотрудники компаний получают инструменты, с помощью которых можно переводить тексты, решать маркетинговые задачи. Недавно мы начали тестировать продажи и выявили большой интерес со стороны пользователей. Сейчас создана первая версия, в планах сделать приложения для iOS и Android, добавить сервис цифровых аватаров. Так, можно записать образец своего голоса, фрагмент видео, дать любой текст, и вашим голосом со своим изображением вы сможете донести любую информацию до целевой аудитории. По сути, за 10 минут можно создать любое маркетинговое сообщение. Это отдельный продукт, в его основе пять нейросетей, которые анализируют звук, видео, расшифровывают текст, расставляют ударения. При этом если нет времени и возможности писать текст и размещать посты, есть автоматические сервисы и в зависимости от тональности комментариев можно отправлять пользователям сообщения.
Добавлен сервис презентаций, есть опция copilot-разработки для тех, кто тратит много времени на написание кода. Сейчас существует возможность с помощью нейросети создавать простые алгоритмы, которые позволяют экономить время разработчиков. Большой спрос выявлен на консалтинг и обучение для тех, кто высоко оценил возможности продукта, но пока не умеет им пользоваться.
Последнее направление — внутренние ИТ-продукты издательства:
— Все продукты, которые мы используем: 1С, «Битрикс» и т.п., дорабатываются внутри компании. В планах компании — разработка сервиса озвучки с помощью клонированного голоса, мы действуем примерно по тому же алгоритму, что и «Яндекс»: разметка текста, генерация голоса, определение тональности. Всё это можно делать с помощью нескольких нейросетей. Почти готов бот-библиотекарь. Мы обучили нейросеть на всех наших книгах, и в дальнейшем можно будет по запросу подобрать любое издание. Ещё один специализированный сервис — алгоритм детекции звуковых ошибок при создании фонограмм. Несмотря на то что студии озвучивают аудиокниги живыми голосами, актёры делают немало ошибок. Обычно проблема решалась тем, что человек слушал много часов записи и по тайм-кодам обозначал типичные проблемы: эхо, повтор, пропуск и т.п. Сейчас появилась возможность описать их, обучить нейросеть, она в течение нескольких минут выдаст подозрительные места и таким образом сэкономит время.
ИИ проникает во все сферы жизни, и издательский бизнес не исключение, отметила Асият ЩАМХАЛОВА, специалист по работе с нейросетями «Эксмо». С точки зрения эксперта, нейросети позволяют автоматизировать рутинные задачи, благодаря этому книги выпускаются быстрее и имеют более высокое качество.
— «Эксмо» уделяет большое внимание развитию ИИ, создана специальная группа, которая занимается развитием ИИ-решений. Коллеги отслеживают научные исследования по всему миру, ищут новые инструменты, чтобы впоследствии интегрировать их в издательские процессы. Проводим хакатоны, сотрудничаем с российскими вузами и крупнейшими компаниями, работающими в сфере Data Science и обработки естественного языка. Таким образом находим новые нестандартные решения и классных специалистов. В целом наши сотрудники благодаря ИИ имеют более интересную и разнообразную работу, поскольку освобождаются от рутинных задач, а начинающие авторы привлекают внимание редакторов благодаря ИИ-технологиям. Мы постоянно ищем полезные и интересные книги non-fiction. Как это происходило раньше? Редактор отправлял потенциально интересную книгу рецензенту, тот её читал и готовил отчёт. На основании его редактор принимал решение о судьбе книги. Очевидно, что работа рецензента занимала много времени и стоила недёшево. Поэтому мы решили придумать ИИ-рецензента. За считанные минуты нейросеть не только переводит книгу, но и даёт краткое содержание, находит запрещённые и рискованные темы, указывает количество и тип иллюстраций, даёт оценку сложности книги, насыщенности лексики; таким образом редактор получает достаточно полное представление о книге. Как отметила выступающая, ИИ-рецензент работает не только с русским языком, но и с английским, немецким, французским и с любыми другими романо-германскими языками, а также с корейским, китайским, японским. Сервис принимает книги в формате pdf, epub, может работать с вотермарками, составляет словарь терминов, даёт оценку сложности языка, указывает на наличие дополнительных материалов типа упражнений, примечаний, библиографии и т.д. Это даёт редактору возможность оценить, насколько сложна книга и какие трудности могут возникнуть при переводе.
Что касается оценки и отбора художественных текстов: в «Эксмо» ежемесячно поступает большой поток рукописей, и редакторы тратят много времени на то, чтобы их прочитать и дать им оценку. Не всегда получается оперативно уделить внимание каждому тексту. Поэтому в издательстве разработали ИИ-инструмент, создали два датасета из опубликованных книг и рукописей, разделили их на бестселлеры, книги среднего качества и не очень хорошие тексты, обучили модель на 4 тыс. признаков: длительности предложений, стиле речи, оценках читаемости текста, и на их основе нейросеть даёт оценку рукописи — насколько она будет интересна читателям и способна ли стать бестселлером.
— Конечно, не ИИ принимает решение об издании книги, а редактор. Но редакторы благодаря ИИ могут обратить внимание на потенциально интересную рукопись и не упустить её. Инструмент оценивает распределение эмоций в тексте и эмоциональную насыщенность. Мы выделили более 20 эмоций, по которым модель строит графики, и, если они покажут минимальный перепад эмоций, книга рискует стать неликвидом. Редакторы перед публикацией могут рекомендовать добавить эмоций в текст, если книга в принципе понравилась. В целом благодаря ИИ снижается риск пропустить интересный текст. В то же время мы экономим на обработке некачественных рукописей. Начинающие авторы получают больше шансов на то, что на них обратят внимание. В результате читатели получают больше качественных и интересных книг, — подчеркнула в завершение эксперт.
В объединённой розничной сети (ОРС) «Читай-Город — Буквоед» стремятся найти баланс между уютным классическим «ламповым» книжным магазином и новыми технологиями, «цифрой», позволяющими сделать богаче читательский опыт. К дискуссии подключился Евгений МИХАЛЬСКИЙ, директор по продукту ОРС «Читай-Город — Буквоед»:
— Персональные рекомендации в мобильных приложениях считаются нейросетью на основе покупок, оценок, просмотров читателей. Единственное, что она не научилась делать, — видеть, какие книги берут с полок, но не покупают. Однако мы задумались над тем, что делать с читателями, у которых ещё нет опыта взаимодействия с ОРС «Читай-Город — Буквоед», кто пока не может похвастаться историей заказов в интернет-магазине или офлайн-покупками. Мы сделали плавный вход в рекомендательную систему: достаточно выбрать три последние книги, которые вы читали и они вам понравились, и мы подберём список книг, которые вам могут быть интересны. Достаточно 10 оценок этих книг, чтобы сформировать базовые рекомендации. В октябре мы сделаем сервис доступным всем пользователям. Вы сможете в любой момент зайти в приложение «Читай-город» и посмотреть, что вам может быть интересно.
Традиционный книжный ретейл — наша основа. Количество и качество книжных магазинов напрямую коррелируют с числом читающих людей в регионе. Мы решили не пытаться заменить ИИ продавца книг, но дать ему инструмент для эффективного общения с покупателями. В нашем мобильном приложении в сервисе «Я в магазине», который давно работает и связан с адресным хранением, мы реализовали возможность диалога покупателя и продавца. По запросу можем выдать на экран телефона список книг, интересных вам и, главное, имеются в магазине, внутри которого вы находитесь. Их можно взять с полок, полистать. В любой момент можно изменить запрос и под ту книгу, какую взяли, подобрать некоторое количество потенциально похожих изданий. Эта практика получит развитие в 2024—2025 гг. Если магазин подключён к адресному хранению, сервис показывает нахождение книги на конкретной полке. Если вы авторизуетесь в сервисе с тем же аккаунтом, с каким работаете с «Читай-Городом» онлайн, мы покажем, где в конкретном магазине находятся книги, которые вы добавили в «Избранное».
Сборник «Механическое вмешательство» — книга, написанная совместно с «Алисой» на «Яндекс GPT» 15 разными авторами. Идейный вдохновитель этого проекта писатель Ксения БУРЖСКАЯ поделилась опытом и впечатлениями:
— Это первый случай на российском книжном рынке, когда книга написана авторами вместе с ИИ. В проекте участвовали 15 разных авторов со своими стилями и подходами. У них не было никакого техзадания, им просто дали ссылку на чат-бот и попросили с ним поработать. Сначала не получалось, но в процессе эксперимента писатели поняли, как с ним иметь дело. Рассказы получились абсолютно разные, и писатели пошли каждый своим путём. Кто-то попросил ИИ предложить какие-то обстоятельства происходящего, кто-то — придумать сюжет или заголовок. В некоторых рассказах даже непонятно, какую часть писал ИИ, она включена ювелирно. В каких-то местах специально указано, что это речь ИИ. В аудиоверсии часть, которую писали авторы, озвучена актёрами, а «Алиса» озвучивает свои фрагменты.
Реакции были разными. Но во-первых, никто не отказался и не сдался, все дошли до финала и сдали рассказы, причём в короткий срок. От начала идеи и до завершения проекта прошло два месяца, причём месяц потребовался на настройку. Некоторые говорили, что сложно использовать такой инструмент, потому что писательство — одиночный забег и людям иногда некомфортно с кем-то делиться. Но для меня это хороший инструмент, я в своих романах его использую. Конечно, он ещё развивается, ему надо много учиться, но со временем он станет эффективным. Я далека от мысли, что ИИ хочет заменять человека, его задача — помогать. И в будущем он станет эффективным ассистентом, если люди научатся использовать технологию.
Библиотеки тоже не чужды экспериментам с ИИ. К разговору присоединился Илья ГАВРИШИН, заместитель генерального директора Российской государственной детской библиотеки (РГДБ) по информатизации:
— РГДБ — оператор электронной библиотеки «НЭБ. Дети», существенной частью которой являются диафильмы. Мы решили попробовать озвучивать диафильмы-экскурсии, где внутри текста нет, он вынесен в отдельную брошюру, с помощью ИИ. Это быстро, дёшево, относительно безопасно и очень интересно. В процессе столкнулись со всеми проблемами, о которых рассказывали коллеги из «Букмейта». ИИ сложно справляться с очень длинными предложениями, каких много в экскурсиях, и в определённый момент начинаются проблемы с интонацией. Ему сложно и со стихами, а их достаточно много, когда речь идёт о местах, связанных с поэтами. Но в целом большинство текстов звучит естественно, и, благодаря тому что многие компании работают в направлении генерации голоса, эти проблемы уйдут, а инструменты станут доступными широкому пользователю.
Отрасль шагнула далеко вперёд, но всё-таки это деньги, серьёзные затраты. Как оценивается эффективность? Есть ли какие-то маркеры?
А. Щамхалова:
— Разумеется, когда проект стартует, мы рассчитываем стоимость разработки и то, какой будет отдача по качеству отбора книг и в финансовом плане. Издательству ИИ позволяет получать более высокое качество за меньшие деньги. Конечно, мы сравниваем стоимость до ИИ и с его применением. Безусловно, каждый проект требует подготовки и осмысления.
Е. Михальский:
— В прошлом году проводили большое исследование, и все клиенты говорят о том, что им интересны книжные новинки, но хотят получать их в соответствии с предпочтениями. Мы научили нейросеть сортировать новинки по пользователям: клиент видит персонифицированную полку новинок и хитов и число откликов растёт на 20–30%. Я бы сказал, что бюджеты разработки, особенно если их не раздувать, очень быстро окупаются.
А. Лиманский:
— Изначально ИИ-платформа планировалась как внутренний инструмент «Альпины». Когда все стали пользоваться GPT, было много проблем с зарубежными счетами, всё надо было как-то организовывать, кому-то что-то возмещать и возникла идея сделать всё удобным образом внутри издательства. На определённом этапе поняли, что другим компаниям идея также может быть интересна, что это вполне себе коммерческий продукт, особенно если добавить опции в виде цифровых аватаров и т.п. Таким образом надеемся окупить разработку. Думаю, что год успешных продаж наши расходы компенсирует. То же самое с детекцией звуковых ошибок. Изначально это был внутренний запрос: мы хотели совершенствовать качество. Но если проект будет активно работать, то предложим его компаниям, которые занимаются озвучиванием книг.
Не секрет, что серьёзная проблема книжного бизнеса — квалифицированные кадры. Как обучать людей? Как их мотивировать работать с ИИ-инструментарием?
А. Лиманский:
— Мы в «Альпине» создали комьюнити — чат, в котором общаются около 80 человек. Делимся опытом использования, промптами, новыми способами применения, периодически проводим вебинары, где каждый может рассказать о своей практике. Понятно, что у всех разные способности и свой темп. Но уже сейчас при приёме на работу можно задавать вопросы о том, насколько человек готов к работе с нейросетями. Думаю, что это будет обязательным навыком.
А. Щамхалова:
— Конечно, многие в целом опасаются ИИ как любого непонятного явления, того, что он заменит людей и они останутся без работы. Но мы стремимся донести до сотрудников, что ИИ их не заменит, а поможет им избавиться от наиболее скучной части работы. Когда мы создаём проекты для редакторов, то не работаем отдельно, а находимся с ними в прямом контакте. Например, сервис, который работает с non-fiction, на каждом этапе получал одобрение или порицание коллег. Когда его внедрили, поэтапно обучали редакторов с ним работать, и сейчас все активно им пользуются.
Е. Михальский:
— Мы стараемся на всю команду проецировать позитивный опыт. Не могу сказать, что за последний год сталкивался с отторжением этих идей, со страхом и т.д. У сотрудников нет опасения того, что их заменит ИИ.
Рубрика: Инновационные технологии
Год: 2024
Месяц: Октябрь
Теги: Нейросети Искусственный интеллект (ИИ) Александр Лиманский Илья Гавришин Денис Димитров Виталий Григораш Александр Фефелов Асият Щамхалова Евгений Михальский Ксения Буржская